home *** CD-ROM | disk | FTP | other *** search
/ NetNews Offline 2 / NetNews Offline Volume 2.iso / news / comp / sys / amiga / programmer / 2161 < prev    next >
Encoding:
Internet Message Format  |  1996-08-05  |  1.9 KB

  1. Path: nntp.teleport.com!sschaem
  2. From: sschaem@teleport.com (Stephan Schaem)
  3. Newsgroups: comp.sys.amiga.programmer
  4. Subject: Re: TMapping again!
  5. Date: 27 Jan 1996 23:21:42 GMT
  6. Organization: Teleport - Portland's Public Access (503) 220-1016
  7. Message-ID: <4eec27$pte@maureen.teleport.com>
  8. References: <4d6v0t$3dt@maureen.teleport.com> <4dg4jk$km@news.cs.tu-berlin.de> <4dhvd5$5r2@maureen.teleport.com> <38232113@kone.fipnet.fi> <4e10ol$ck3@maureen.teleport.com> <4e2ku6$31m@news.cs.tu-berlin.de>
  9. NNTP-Posting-Host: julie.teleport.com
  10. X-Newsreader: TIN [version 1.2 PL2]
  11.  
  12. Philipp Boerker (rawneiha@hydra.zrz.TU-Berlin.DE) wrote:
  13. : sschaem@teleport.com (Stephan Schaem) writes:
  14.  
  15. : >        repeat  8
  16. : >        mw      D1,D2
  17. : >        mb      D0,D2
  18. : >        addx.l  d7,D0
  19. : >        movea.l d2,a0
  20. : >        addx.l  d6,D1
  21. : >        mw      (A0),d3
  22. : >        mw      D1,D2
  23. : >        mb      D0,D2
  24. : >        movea.l d2,a0
  25. : >        mb      (A0),d3
  26. : >        addx.l  d7,D0
  27. : >        addx.l  d6,D1
  28. : >        mw      d3,(a1)+
  29. : >        endr
  30.  
  31. : > the above map 2 pixels from a 256x256 tmap buffer...
  32. : > You should be able to use 24bit precission .
  33.  
  34. : I think mapping 2 pixels like you did is not optimal.
  35. : If the first pixel is the lowest byte of a long the
  36. : word read will cause two mem reads. The only thing you
  37. : save is a write. But reads stop the processor while
  38. : writes don t! Do proper pipelining instead.
  39.  
  40.  'proper' pipelining... or maximum overlape of bus and sequencer
  41.  activity for my test is as above. I didn't count paper cycles,
  42.  but saw my fps get improved when I do the above VS 2 move.b  ,(a1)+
  43.  (BTW notice the instruction register usage, and the ordering. should
  44.  be optimal for a 060 and take the best advantage of overlap in the
  45.  case of a 2 move.b to mem version)
  46.  I agree about doing word read can cross long boundary and require 2
  47.  access... But if its a problem on other usage of the loop above
  48.  Its so simple to make it write to (a1)+ vs d3.
  49.  
  50.  Stephan
  51.